慕课网Flask高级编程实战-2.搜索书籍路由编写

图书数据库的基地址

# 基地址
http://t.yushu.im
# 关键字搜索
http://t.yushu.im/v2/book/search?q={}&start={}&count={}
# isbn搜索
http://t.yushu.im/v2/book/search/isbn/{isbn}
# 豆瓣api
https://api.douban.com/v2/book

截止2018你那9月11日，以上地址已经无法访问，此地址仅为项目演示地址

定义参数，判断查询参数q是否是isbn号

@app.route("/search/q/<page>")
def search():
	"""
	搜索书籍路由
	:param q: 关键字 OR isbn
	:param page: 页码
	# isbn isbn13 由13个0-9在数字组成
	# isbn10 由10表0-9表数字组组成，中间可能包含' - '
	"""
	isbn_or_key = 'key'
	
	isbn_or_key = 'key'
    if len(q) == 13 and q.isdigit():
        isbn_or_key = 'isbn'
    short_q = q.replace('-', '')
    if '-' in q and len(short_q) == 10 and short_q.isdigit():
        isbn_or_key = 'isbn'
    pass

要点解析

判断字符串是否是数字，可以使用函数 isdigit()
in 关键字可以判断一个字符串是否包含在另外一个字符串中
多个逻辑循环原则：
- 尽量把判断结构为的假的放在前边，利用逻辑判断的短路优势，可以减少资源消耗。
- 需要查询数据库的尽量放在后边。

简单重构

上面代码的缺点

判断代码太多，使得代码很臃肿。而且不利于以后代码的复用
代码可读性查，使后来者不能一眼看出主要功能。

重构后的代码

fisher.py

@app.route("/search/<q>/<page>")
def search(q, page):
    """
    搜索书籍路由
    :param q: 关键字 OR isbn
    :param page: 页码
    """
    isbn_or_key = is_isbn_or_key(q)

helper.py

def is_isbn_or_key(word):
    """
        判断word是isbn号还是查询关键字key
        isbn isbn13 由13个0-9在数字组成
        isbn10 由10表0-9表数字组组成，中间可能包含' - '
    :param word:
    :return: key or isbn
    """
    isbn_or_key = 'key'
    if len(word) == 13 and word.isdigit():
        isbn_or_key = 'isbn'
    short_word = word.replace('-', '')
    if '-' in word and len(short_word) == 10 and short_word.isdigit():
        isbn_or_key = 'isbn'
    return isbn_or_key

要点解析:

把判断 isbn 的代码隔离出去，新建 helper.py 文件，可以重复利用。

建议

其他地方的代码多一点还可以接受，视图函数中不可以，因为视图函数是一个web项目的入口。所有人阅读都是从这里入手，应该把细节屏蔽掉，给阅读者一个选择。
看源码的技巧：先通读整体，了解整体过程，再回过头来了解细节，不要从一开始就深究每一个细节
过多的注释会让代码变的臃肿，尽量使用易懂的函数名来代替注释，保持代码的简洁性

requests发送http请求及代码的简化手段

http.py

class HTTP:
    """
    封装 request 请求类
    """
    @staticmethod
    def get(url, return_json=True):
        """
       发送get请求
       :param url: 请求路径
       :param return_json: 是否返回json格式的结果
       :return:
       """
        # r 是对这次HTTP请求调用结果的一个封装，并不是我们直接想要的结果，而是想要返回的内容
        r = requests.get(url)
        if r.status_code != 200:
            return {} if return_json else ''
        return r.json() if return_json else r.text

知识点：

简化if-else语句的几种方式
- 1.使用三元表达式；
- 2.if+return；
- 3.将if-else里的代码提取成函数
if+return的理解：
- 把最后一句return前的if+return 全都理解为正常流程之外的一种特例情况的处理；
- 多次if-return，提前结束一些逻辑分支，可以提高代码思维的清晰性
requests的一些说明：
- 1.get()发送get请求；
- 2.返回结果r.status_code 获取返回状态吗；
- 3.r.json()将返回结果序列化成json;
- 4.r.text 将返回结果不做处理直接返回

requests vs urllib

发送http请求的两种方法：

1.使用urllib(python内置)
2.使用requests（需要使用pip3安装）

urllib的用法：

urllib缺点分析

需要对url进行编码，并且有些字符不需要编码还要声明出来
返回的结果是字节码，需要包装成字符串
404的情况是通过异常的形式抛出，现在流行的restful，404已经不是一种异常了

从API获取数据

将具体调用`HTTP`请求，获取结果的业务代码封装到`YuShuBook中

class YuShuBook:
    """
    请求接口的定义类
    """
    search_by_isbn_url = "http://t.yushu.im/v2/book/search/isbn/{}"

    search_by_key_url = "http://t.yushu.im/v2/book/search?q={}&count={}&start={}"

    @classmethod
    def search_by_isbn(cls, isbn):
        """
        1.组装 search_by_isbn_url 地址
        2.返回对地址的请求数据,默认返回 Json 数据
        """
        url = cls.search_by_isbn_url.format(isbn)
        return HTTP.get(url)

    @classmethod
    def search_by_key(cls, q, count=15, start=0):
        """
        1.组装 search_by_key_url 地址
        2.返回对地址的请求数据,默认返回 Json 数据
        """
        url = cls.search_by_key_url.format(q, count, start)
        return HTTP.get(url)

使用 `json.dumps` 序列表返回结果，在视图函数中进行返回，并声明状态码和返回类型(一个元组)

@app.route("/book/search/<q>/<page>")
def search(q, page):
    """
    搜索书籍路由
    :param q: 关键字 OR isbn
    :param page: 页码
    """
    isbn_or_key = is_isbn_or_key(q)
    if isbn_or_key == 'isbn':
        result = YuShuBook.search_by_isbn(q)
    else:
        result = YuShuBook.search_by_key(q)

    return json.dumps(result), 200, {'content-type': 'application/json'}
    #可以使用 flask 提供的 jsonify 包替代
    #return jsonify(result)

可以使用flask提供的jsonify替换麻烦的json.dumps和元组

将视图函数拆分到单独的模块中

1.将试图函数都放在一个文件中有哪些不足：

代码太长，不利于维护
从业务模型抽象的角度，不应该把他们都放在一个文件中。关于书籍相关的API就应该放在书籍模型的视图函数文件中，跟用户相关的API就应该放在用户模型相关的文件中
入口文件的意义比较独特，会启动web服务器以及做很多初始化的操作，就算要放在一个文件也不应该业务的操作放在入口文件中来

2.尝试拆分模块

思路

将试图函数抽离到单独的包中，然后在新的试图文件中引入flask.py来导入app核心对象。

为了新的试图文件中的路由可以成功注册，再在flask.py中引入刚刚抽离出的试图模块

修改后的fisher.py

from flask import Flask

# 为了可以注册book.py中的路由
from app.web import book

app = Flask(__name__)

app.config.from_object("config")

if __name__ == "__main__":
app.run(host=app.config["HOST"], debug=app.config["DEBUG"], port=app.config["PORT"])

新增的book.py

from flask import jsonify

from helper import is_isbn_or_key
from yushu_book import YuShuBook

# 为了让book.py模块可以使用app对象
from fisher import app

__author__ = "Jason"


@app.route("/book/search/<q>/<page>")
def search(q, page):
"""
搜索书籍路由
:param q: 关键字 OR isbn
:param page: 页码
"""
isbn_or_key = is_isbn_or_key(q)
if isbn_or_key == 'isbn':
result = YuShuBook.search_by_isbn(q)
else:
result = YuShuBook.search_by_key(q)

return jsonify(result)

但是这样做并不是正确的做法，结果表明，这样修改以后，访问search api会404

为了知道为什么这样做不行，我们需要先刨铣一下Flask路由机制的原理

3.Flask路由机制

flask路由机制

flask的基本思想是内部会维护一个字典。

每一个url都会对应一个视图函数，但是不仅仅是这样。

每一个url还会对应一个endpoint端点。用于反向构建URL（后面会讲解)

flask的路由注册app_url_rule(url=,view_func=,endpoint=)会接受三个参数，

前两个我们都知道了，第三个就是上面说的endpoint。他的默认值是view_func的名称。

当然，app.route('url',endpoint=)也可以传入

flask route的部分源码

def route(self, rule, **options):
    """A decorator that is used to register a view function for a
    given URL rule.  This does the same thing as :meth:`add_url_rule`
    but is intended for decorator usage::

        @app.route('/')
        def index():
            return 'Hello World'

    For more information refer to :ref:`url-route-registrations`.

    :param rule: the URL rule as string
    :param endpoint: the endpoint for the registered URL rule.  Flask
                     itself assumes the name of the view function as
                     endpoint
    :param options: the options to be forwarded to the underlying
                    :class:`~werkzeug.routing.Rule` object.  A change
                    to Werkzeug is handling of method options.  methods
                    is a list of methods this rule should be limited
                    to (``GET``, ``POST`` etc.).  By default a rule
                    just listens for ``GET`` (and implicitly ``HEAD``).
                    Starting with Flask 0.6, ``OPTIONS`` is implicitly
                    added and handled by the standard request handling.
    """
    #注册路由的装饰器函数
    def decorator(f):
        endpoint = options.pop('endpoint', None)
        #实际是调用内部的 add_url_rule 函数
        self.add_url_rule(rule, endpoint, f, **options)
        return f
    return decorator

通过端点调试可以发现，Flask内部由url_map 维护一个url->endpoint 的指向。

由view_functions 记录 endpoint所指向视图函数的函数，

这样请求进入到Flask内部，才能通过Url找到对应的视图函数

4. 循环引入流程分析

从上面的断点调试中发现，我们的url_map和view_functions中都已经维护了相关的信息。

但是为什么还是会出现404的情况，这是因为fisher.py和book.py出现了循环引入的情况。

下面看下fisher.py和book.py的具体流程图

图中有两种颜色的线：红色的线是fisher主执行文件被执行之后的执行路径；

蓝色的线是book模块被导入之后循环导入的执行路径。

1.主流程开始之后，首先到达导入book的语句。然后进入book模块中执行
2.book模块开始之后，首先到达导入fisher的语句（循环导入），这个时候主流程暂时结束，重新执行fisher中的代码
3.这时候又回到fisher中的导入book的语句，由于book已经被导入一次，所以不会再次导入，进入if语句，这个时候的name是book导入fisher时候的name:fisher，不是主流程main，所以if语句条件为false。蓝色线执行终止，重新回到2. book导入fisher的语句。
4.继续向下执行book 中app.route注册路由的语句。然后book执行完，回到fisher主流程执行中。
5.到达if语句，这个时候name为main。执行run方法，启动服务

回答流程图中的两个问题：

问题1：因为都是由fisher引入book，一个模块只会引入另一个模块一次。所以只执行了一次book
问题2：由于一次是主流程执行fisher文件；一次是由book模块导入 fisher。

5.找不到视图函数的最终解释和证明

整个流程中，出现了两次核心app对象的初始化，注册路由是在蓝色流程中初始化的app注册的。

但是启动服务是红色流程中的app启动的

book中注册路由所使用的app对象，是他自己所导入fisher模块的app对象（蓝色流程中），

而不是红色主流程中所实例化的app对象

加入一些日志出数验证我们的结论。

我们在app实例化，启动，注册路由是哪个地方加入日志信息，来观察一下

book.py

print("id为"+str(id(app))+"的app注册路由")


@app.route("/book/search/<q>/<page>")
def search(q, page):
    """
    搜索书籍路由
    :param q: 关键字 OR isbn
    :param page: 页码
    """
    isbn_or_key = is_isbn_or_key(q)
    if isbn_or_key == 'isbn':
    result = YuShuBook.search_by_isbn(q)
    else:
    result = YuShuBook.search_by_key(q)
    
    return jsonify(result)

fisher.py

app = Flask(__name__)
print("id为"+str(id(app))+"的app实例化")

app.config.from_object("config")

# 为了可以注册book.py中的路由
from app.web import book

if __name__ == "__main__":
    print("id为" + str(id(app)) + "的app启动")
    app.run(host=app.config["HOST"], debug=app.config["DEBUG"], port=app.config["PORT"])

执行结果

pydev debugger: process 63816 is connecting

id为4350444824的app实例化
id为4355159656的app实例化
id为4355159656的app注册路由
id为4350444824的app启动
* Debugger is active!
* Debugger PIN: 176-669-651

可以看到注册路由的app，和启动服务的app不是同一个app。

并且最后启动的app是最先实例化的app，也就是红色主流程的app；

而注册路由的app是后实例化的app，也就是由book导入fisher模块的蓝色流程的app

定义参数，判断查询参数q是否是isbn号

要点解析

简单重构

上面代码的缺点

重构后的代码

fisher.py

helper.py

要点解析:

建议

requests发送http请求及代码的简化手段

http.py

知识点：

requests vs urllib

发送http请求的两种方法：

urllib的用法：

urllib缺点分析

从API获取数据

将具体调用HTTP请求，获取结果的业务代码封装到`YuShuBook中

使用 json.dumps 序列表返回结果，在视图函数中进行返回，并声明状态码和返回类型(一个元组)

将视图函数拆分到单独的模块中

1.将试图函数都放在一个文件中有哪些不足：

2.尝试拆分模块

思路

修改后的fisher.py

新增的book.py

3.Flask路由机制

flask路由机制

flask route的部分源码

4. 循环引入流程分析

回答流程图中的两个问题：

5.找不到视图函数的最终解释和证明

加入一些日志出数验证我们的结论。

book.py

fisher.py

执行结果

将具体调用`HTTP`请求，获取结果的业务代码封装到`YuShuBook中

使用 `json.dumps` 序列表返回结果，在视图函数中进行返回，并声明状态码和返回类型(一个元组)